首页> 外文OA文献 >A Reconfigurable Streaming Deep Convolutional Neural Network Accelerator for Internet of Things
【2h】

A Reconfigurable Streaming Deep Convolutional Neural Network Accelerator for Internet of Things

机译:一种可重构流式深度卷积神经网络加速器   物联网

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Convolutional neural network (CNN) offers significant accuracy in imagedetection. To implement image detection using CNN in the internet of things(IoT) devices, a streaming hardware accelerator is proposed. The proposedaccelerator optimizes the energy efficiency by avoiding unnecessary datamovement. With unique filter decomposition technique, the accelerator cansupport arbitrary convolution window size. In addition, max pooling functioncan be computed in parallel with convolution by using separate pooling unit,thus achieving throughput improvement. A prototype accelerator was implementedin TSMC 65nm technology with a core size of 5mm2. The accelerator can supportmajor CNNs and achieve 152GOPS peak throughput and 434GOPS/W energy efficiencyat 350mW, making it a promising hardware accelerator for intelligent IoTdevices.
机译:卷积神经网络(CNN)在图像检测中提供了显着的准确性。为了在物联网(IoT)设备中使用CNN进行图像检测,提出了一种流硬件加速器。所提出的加速器通过避免不必要的数据移动来优化能源效率。通过独特的过滤器分解技术,加速器可以支持任意卷积窗口大小。另外,通过使用单独的池化单元,可以与卷积并行地计算最大池化函数,从而提高吞吐量。在台积电65nm技术中实现了原型加速器,其核心尺寸为5mm2。该加速器可以支持主要的CNN,并在350mW的功率下达到152GOPS的峰值吞吐量和434GOPS / W的能源效率,使其成为用于智能IoT设备的有希望的硬件加速器。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号